#llm judges

VERDI: Estimación de confianza de una sola llamada para jueces LLM basados en verificación mediante inferencia descompuesta

VERDI mejora la confianza en LLM judges usando inferencia descompuesta. Descubre cómo optimizar la evaluación de modelos de lenguaje.